02. 随机变量及其概率分布的核心概念与应用
1. 随机变量与概率分布的基本概念
1.1. 随机变量 (Random Variable, r.v.)
- 核心定义:随机变量是定义在样本空间上的一个实值函数,通常用大写字母 表示。它的本质是将随机试验的每一个可能结果(样本点)映射到一个具体的数值。
- 作用:将复杂的、非数值的随机事件问题,转化为对数值函数的分析,从而可以使用微积分等数学工具进行研究。
1.2. 随机变量的分类
根据随机变量可能取值的特征,可以分为两类:
- 离散型随机变量 (Discrete random variable):其全部可能取值是有限个或可列无限多个。
- 用例:一天内某餐厅的顾客数量、抛硬币 10 次出现正面的次数。
- 连续型随机变量 (Continuous random variable):其全部可能取值可以充满一个或多个区间,是不可数的。
- 用例:一辆公交车的等待时间、一个电子元件的寿命。
1.3. 概率分布 (Probability Distribution) 的描述
概率分布描述了随机变量取所有可能值的概率规律。不同类型的随机变量有不同的描述工具。
| 描述工具 | 适用类型 | 定义 | 核心性质 |
|---|---|---|---|
| 概率质量函数 (PMF) Probability Mass Function | 离散型 | 1. 非负性: 2. 规范性: | |
| 概率密度函数 (PDF) Probability Density Function | 连续型 | 1. 非负性: 2. 规范性: | |
| 累积分布函数 (CDF) Cumulative Distribution Function | 通用 | 1. 非减函数 2. , 3. 右连续 |
重点辨析:PDF 的含义
对于连续型随机变量 及其概率密度函数 :
- 本身不是概率! 事实上,对于任意一点 ,有 。
- 的值反映了概率在点 附近的“密集程度”或“浓度”。 的值越大,意味着 取值在 附近的概率越高。
- 用例:假设 代表某城市成年男性的身高(单位:米),其 PDF 为 。如果 ,这并不意味着身高恰好为 1.75 米的概率大于 1.90 米的概率(两者都为 0),而是意味着身高在 1.75 米附近一个很小区间内(如 )的概率,要大于身高在 1.90 米附近一个同样大小区间内(如 )的概率。
CDF 的重要应用 对于任意随机变量 ,其 CDF 为 ,则计算区间概率的核心公式为:
对于连续型随机变量,由于单点概率为 0,所以 。
2. 随机变量的数字特征
数字特征是用少数几个数字来概括概率分布的某些关键方面。
2.1. 数学期望 (Mathematical Expectation)
- 定义:也称为均值 (Mean) 或期望值 (Expected Value),记 为 。它代表了随机变量取值的“加权平均值”或“长期平均水平”。
- 离散型:
- 连续型: